EvoClass
AI012
Khám phá sâu về các mô hình ngôn ngữ lớn
Các tác nhân tự chủ, RLHF và sự đồng bộ hóa an toàn
Mục tiêu học tập
- Phân tíchcác thành phần kiến trúc của các tác nhân giao diện người dùng (GUI), bao gồm các module lập kế hoạch, ra quyết định và phản tư trong hệ thống nhiều tác nhân.
- Giải thíchcơ chế của Học tăng cường (RL) và RLHF, đặc biệt là vai trò của các mô hình thưởng và PPO trong việc điều chỉnh hành vi tác nhân phù hợp với giá trị con người.
- Đánh giácác rủi ro an toàn và vấn đề độ tin cậy trong các tác nhân tự chủ, bao gồm lỗi ngoài phân bố (OOD), các cuộc tấn công vượt rào, và các yếu tố gây xao nhãng từ môi trường.